苹果M4芯片普及推动本地AI发展,开发者jola在24GB内存的M4 MacBook Pro上成功部署本地AI工作流。测试显示,优化后的Qwen 3.5-9B模型生成速度达每秒40 tokens,为离线办公和私密开发提供高效方案。选型上,9B模型被认为是本地运行大语言模型的最优解,平衡了性能与资源需求。
DeepSeek宣布全系API输入缓存价格大幅下调至首发价的1/10,其中V4-Pro缓存输入价格降至0.1元/百万Tokens,限时优惠后仅0.025元,远低于海外竞品GPT-5.5Pro。此举旨在通过极致性价比吸引更多开发者和企业接入,标志着国产AI成本控制进入新阶段。
DeepSeek于4月24日发布新一代大模型DeepSeek-V4,性能比肩顶级闭源模型,成为开源AI里程碑。它支持100万tokens超长上下文,适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版,分别满足快速迭代与深度应用需求。
京东云发布OpenClaw自动化工具,作为“全民养虾计划”核心,联合多部门通过“数字龙虾”兑换实体龙虾的趣味激励,降低AI Agent技术门槛,加速其在远程控制与自动化办公场景的应用。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
-
$4
$16
$2
$20
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
unsloth
Devstral 1.1是由Mistral AI和All Hands AI合作开发的智能大语言模型,专为软件工程任务设计。该模型在SWE-bench基准测试中表现出色,位列开源模型榜首,拥有240亿参数和128k tokens的长上下文窗口。
lmstudio-community
Kevin 32B是由Cognition AI开发的大语言模型,支持超长上下文(40960 tokens),专注于CUDA内核生成和强化学习任务。